Textdaten-Verarbeitung mit TUSTEP


Arbeitsweise, Einsatzzweck

Grundoperationen von TUSTEP

Organisatorische Leistungen in TUSTEP

Hinweise, Veranstaltungen


Arbeitsweise, Einsatzzweck

Das "Tübinger System von Textverarbeitungsprogrammen" TUSTEP wurde am Zentrum für Datenverarbeitung der Universität Tübingen mit dem Ziel entwickelt, ein leistungsfähiges Werkzeug zum wissenschaftlichen Umgang mit Textdaten zur Verfügung zu stellen.

Die Anfänge dieser Arbeiten gehen auf das Jahr 1966 und die folgenden Jahre zurück, als nach dem Vorbild des nicht-numerischen Unterprogrammpakets des Deutschen Rechenzentrums Darmstadt ein System von Unterprogrammen zur Zeichen- und Zeichenketten-Verarbeitung in FORTRAN entworfen und auf der Tübinger Anlage implementiert wurde. Diese erleichterten die Programmierung für damals betreute Projekte wie die metrische Analyse lateinischer Hexameter, die Konkordanz zur Vulgata oder die Edition und die Register zu den Werken Heinrich Kaufringers.

Aufgrund der Erfahrung mit solchen Projekten konnte der nächste Schritt getan werden, der nicht mehr Programmierung in FORTRAN oder einer anderen "höheren" Programmiersprache erforderte, sondern dem Benutzer selbst für die wichtigsten Grundoperationen der Verarbeitung von Textdaten Programme bereitstellte, deren Leistung er selbst über Parameter weiter spezifizieren und die er in vielfältiger Weise für die Lösung verschiedenster Aufgabenstellungen kombinieren konnte. Den Namen TUSTEP tragen diese Programme seit Februar

Der Begriff Text daten -Verarbeitung soll TUSTEP von dem, was heute üblicherweise unter Textverarbeitung verstanden wird, abgrenzen. Selbstverständlich gehören auch die für die Dokumenten-Erstellung notwendigen Funktionen: Eingabe, Korrektur, Formatieren, Drucken von Texten zum Leistungsangebot von TUSTEP, da diese in allen Wissenschaftsbereichen zum Zweck der Dokumentation und Publikationsvorbereitung benötigt werden. TUSTEP wurde aber als Werkzeug vor allem für diejenigen Wissenschaften entwickelt, in denen Texte Objekte der Forschung sind: Philologien, Sprachwissenschaften, Literaturwissenschaften, historische Wissenschaften, Bibliothekswesen; Wissenschaften also, in denen nicht nur neue Texte als Produkt der eigenen wissenschaftlichen Arbeit erstellt und publiziert werden sollen, sondern in denen schon existierende, überlieferte, schriftlich fixierte oder zu fixierende Texte (einschließlich literarischer Texte und historischer Quellen) durch kritische Neuedition gesichert, sprachlich und stilistisch analysiert, inhaltlich erschlossen, bibliographisch erfaßt werden müssen.

Dem tragen Grundoperationen der Textdaten-Verarbeitung (und entsprechende TUSTEP-Programme) Rechnung, die mit folgenden Schlagworten grob charakterisiert werden können: Vergleichen von verschiedenen Textfassungen; Korrigieren nicht nur interaktiv im Editor, sondern auch anhand vorbereiteter (u.U. automatisch erstellter) Korrekturanweisungen; Zerlegen von Texten in (vom Benutzer zu definierende) Elemente (z. B. Wortformen); Sortieren von Textelementen oder von längeren Texteinheiten nach einer Vielzahl von Alphabeten und anderer Kriterien; Register erstellen durch Zusammenfassen sortierter Textelemente; Bearbeiten von Textdaten durch vom Benutzer definierete Regeln zum Auswählen, Ersetzen, Umstellen, Ergänzen, Zusammenfassen, Vergleichen von Textteilen, durch Rechnen mit Zahlenwerten, die bereits im Text enthalten sind (z. B. Kalenderdaten) oder aus ihm gewonnen werden können (z. B. die Zahl der Wörter in einem Satz), und Ausgeben in verschiedenen Formaten, einschließlich solcher, die von anderen Systemen (z. B. SPSS zur statistischen Auswertung) benötigt werden.

Aufgaben, die mit TUSTEP bearbeitet werden, reichen vom Schreiben einer Seminararbeit bis hin zum Erstellen von umfangreichen Bibliographien, Lexika, Indizes, Konkordanzen, Wörterbüchern, Editionen und natürlich auch Monographien, jeweils einschließlich der automatischen Herstellung der Druckvorlagen für diese Werke in der vom Buchdruck gewohnten Qualität.

Neben den Programmen für die Grundoperationen der Textdaten-Verarbeitung enthält TUSTEP auch eine Reihe organisatorischer Leistungen, wie sie üblicherweise vom Betriebssystem eines Rechners bereitgestellt werden. Dies ermöglicht es, alle für die Textdaten-Verarbeitung notwendigen Funktionen, einschließlich der Datenhaltung und Datensicherung, auf Rechnern mit unterschiedlichen Betriebssystemen in gleicher Weise aufrufen zu können und erspart damit dem Benutzer beim Wechsel auf einen Rechner mit einem anderen Betriebssystem nicht nur ein Umlernen, sondern erlaubt auch, bereits erstellte TUSTEP-Kommandofolgen unverändert zu übernehmen.

Die Leistungen von TUSTEP werden ständig verbessert und erweitert, damit auch für neue Aufgabenstellungen der wissenschaftlichen Textdaten-Verarbeitung Lösungsmöglichkeiten bereitstehen. Dabei werden auch neue Hardware und neue Betriebssystem-Entwicklungen berücksichtigt.

TUSTEP steht inzwischen außer in Tübingen auch an vielen anderen Hochschulen zur Verfügung. Es läuft auf IBM-kompatiblen PCs, auf Workstations und auf Großrechnern.

Die folgende Aufstellung gibt einen Überblick über die wichtigsten TUSTEP-Programmen für die Grundoperationen der Textdaten-Verarbeitung und für organisatorische Leistungen (die Angaben in eckigen Klammern sind die jeweiligen Programmnamen).

1. Grundoperationen der Textdaten-Verarbeitung in TUSTEP

EINGEBEN
Übernahme von Textdaten von OCR-Lesegerät (Blattleser), Omnifont-Lesemaschine (z. B. KDEM, OPTOPUS, OmniPage), PC-Textverarbeitungsprogrammen
EDIEREN
Eingeben, Ändern, Ersetzen und Durchsuchen von Textdaten am Datensichtgerät mit dem Texteditor [EDIERE]
Automatische Korrektur von Textdaten über vorbereitete Korrekturanweisungen in Fällen, in denen die Korrektur mit dem Editor nicht sinnvoll ist [KAUSFUEHRE]
VERGLEICHEN
Vergleichen verschiedener Fassungen eines Textes; Protokollieren und Abspeichern der Unterschiede [VERGLEICHE]
Zeilensynoptische Ausgabe der festgestellten Textvarianten [VAUFBEREITE]
BEARBEITEN
Auswählen, Ersetzen, Umstellen, Ergänzen, Zusammenfassen, Vergleichen von Textteilen nach angegebenen Regeln und Bedingungen; Rechnen mit Zahlenwerten (einschließlich Kalenderdaten), die bereits im Text enthalten sind oder aus ihm gewonnen werden können; Ausgeben in verschiedenen Formaten (auch für die Weiterverarbeitung außerhalb von TUSTEP, z. B. für statistische Auswertung mit Programmen wie SPSS) [KOPIERE]
Ersetzen von Kürzeln durch Textteile (auch umfangreiche Textbausteine), die in einer eigenen Datei stehen [EINFUEGE]
Verwalten und Aktualisieren von Querverweisen [NUMERIERE]
REGISTER VORBEREITEN
Erstellen von Register-Einträgen durch Zerlegen von Texteinheiten in ihre Bestandteile oder durch Extrahieren gekennzeichneter Textteile; ggf. Ergänzen und Ändern von Textteilen; Festlegen der Sortierkriterien und Sortieralphabete, Ergänzen der Referenz; Unterscheidung zwischen verschiedenen Eintragstypen [RVORBEREITE]
SORTIERUNG VORBEREITEN
Bilden von Sortiereinheiten aus logisch zusammengehörenden Textteilen; Festlegen von frei wählbaren Sortier-Kriterien (Auswahl und Reihenfolge bestimmter Textteile der Sortiereinheiten), von Sortierwerten für beliebige Zeichenfolgen und von Sortieralphabeten, die für die Bestimmung der Reihenfolge der Sortiereinheiten beim anschließenden Sortieren benutzt werden [SVORBEREITE]
SORTIEREN
Sortieren von Daten in Dateien, die (in der Regel mit RVORBEREITE, z. B. für Registereinträge, oder SVORBEREITE, z. B. für Titel einer Bibliographie) zur Sortierung vorbereitet sind [SORTIERE];
Mischen bereits sortierter Daten bzw. Dateien [MISCHE]
REGISTER AUFBEREITEN
Zusammenfassen sortierter, ggf. hierarchisch gegliederter, Registereinträge (Texteinheiten); Ergänzen und Ersetzen von Textteilen; Möglichkeit der Unterscheidung zwischen verschiedenen Eintragstypen; Berechnen von absoluten und relativen Häufigkeiten [RAUFBEREITE]
DRUCK AUFBEREITEN
Aufbereiten von Textdaten zum Ausdrucken mit Zeilendrucker, Matrixdrucker oder Laserdrucker
  • in der Form, in der die Daten in der Datei stehen, ohne Auswertung darin enthaltener Steuerzeichen [DVORBEREITE]
  • in frei wählbarem Format und frei wählbarer Anordnung (über im Text enthaltene Steuerzeichen), mit automatischer Silbentrennung und automatischem Zeilen- und Seitenumbruch einschließlich Randausgleich und Fußnoten [FORMATIERE]
  • für Formulare (z. B. Adreßaufkleber, Bibliothekskärtchen, vorgedruckte Formulare) [FAUFBEREITE]
SETZEN
Typographisches Aufbereiten von Textdaten zur Ausgabe über PostScript-Drucker oder (für professionellen Satz) eine Lichtsetzanlage (z. Zt. DIGISET, Monotype LASERCOMP, PostScript-Belichter); dabei automatischer Zeilenumbruch (Block-, Flatter-, Tabellensatz) und automatischer Seitenumbruch mit lebenden Kolumnentiteln, Überschriften, Grundtext, Einschaltungen, Fußnoten, Marginalien, bis zu neun kritischen Apparaten; große Auswahl von Schriften und Sonderzeichen [SATZ]
Das Programm SATZ steht unter MS-DOS derzeit nicht zur Verfügung.

2. Organisatorische Leistungen in TUSTEP

DATEIVERWALTUNG
Einrichten, Anmelden, Abmelden, Umbenennen, Löschen von Dateien [DATEI, ANMELDE, ABMELDE, AENDERE, LOESCHE]
DATENAUSTAUSCH
Übernehmen von Textdaten aus Dateien des jeweiligen Betriebssystems und Umwandeln in das TUSTEP-Format; Übergeben von Textdaten aus TUSTEP-Dateien in System-Dateien [UMWANDLE]
ARCHIVIERUNG, SICHERUNG
Eingabe von und Ausgabe auf Magnetband und andere Dateiträger (auch zum Datentransfer zwischen verschiedenen Rechnern); Information über den Inhalt dieser Dateiträger [MBEINGABE, MBAUSGABE, MBKOPIERE, MBINFORMIERE]
ABLAUFSTEUERUNG
Ausführung/Steuerung von Kommandofolgen und Programmen; Einrichten und Ausführen benutzereigener Kommandos (Makros)
[TUE, MAKRO]

3. Hinweise, Veranstaltungen

Stand: Januar 1996
TUSTEP ist eine Entwicklung der Abteilung Literarische und Dokumentarische Datenverarbeitung
des Zentrums für Datenverarbeitung der Universität Tübingen Brunnenstraße 27, D-72074 Tübingen,
E-mail: tustep@zdv.uni-tuebingen.de, Tel. 07071 / 29-7 29 33, 29-7 29 01, Fax 07071 / 29-59 12

... zur TUSTEP-Homepage
tustep@zdv.uni-tuebingen.de - Stand: 13. Januar 1997